課程名稱 |
語料處理方法一 Corpus Processing Method (Ⅰ) |
開課學期 |
101-1 |
授課對象 |
文學院 語言學研究所 |
授課教師 |
謝舒凱 |
課號 |
LING7503 |
課程識別碼 |
142EM1010 |
班次 |
|
學分 |
3 |
全/半年 |
半年 |
必/選修 |
選修 |
上課時間 |
星期三6,7,8(13:20~16:20) |
上課地點 |
樂學館304 |
備註 |
本課程以英語授課。 總人數上限:12人 外系人數限制:5人 |
Ceiba 課程網頁 |
http://ceiba.ntu.edu.tw/1011corpusR |
課程簡介影片 |
|
核心能力關聯 |
核心能力與課程規劃關聯圖 |
課程大綱
|
為確保您我的權利,請尊重智慧財產權及不得非法影印
|
課程概述 |
語料的處理是任何語言分析的前置作業之一。語料的處理,背後涉及許多經驗研究的方法論,與資料處理的觀念與技術。本課程是一系列之語料處理課程之一,主要介紹的是語料處理的方法論入門。本課程之設計,是以語言所與對語言學經驗方法研究有興趣之研究生為對象。本課程的進行方式,除了講授觀念、研讀相關文獻與討論之外,尚有演習課。
在演習課中,將以實際之語料當範本 (包括重要之語料庫、詞彙知識庫與詞彙網路),學習以簡單之程式處理語料。本課程不需要修課者具備任何程式設計背景。
|
課程目標 |
本課程之目標在於
(一)、對於語言學的經驗研究方法有入門的認識;
(二)、對於各種語料之處理有利用電腦實作上的經驗;
(三)、能將上述觀念與技能應用在論文與研究上。
|
課程要求 |
|
預期每週課後學習時數 |
|
Office Hours |
每週三 11:00~12:00 |
指定閱讀 |
教師自編上課講義,於第一次上課時配發。 |
參考書目 |
(837b)Stefan TH. Gries. 2009. Quantitative Corpus Linguistics with R: A Practical Introduction. Routledge.
(837b)R.H. Baayen. 2008. Analyzing Linguistic Data: A Practical Introduction to Statistics using R. Cambridge.
(837b)K. Johnson. 2008. Quantitative Methods in Linguistics. Oxford: Blackwell.
|
評量方式 (僅供參考) |
No. |
項目 |
百分比 |
說明 |
1. |
報告與討論 |
30% |
|
2. |
習題作業 |
30% |
|
3. |
期末計畫與報告 |
40% |
|
|
週次 |
日期 |
單元主題 |
第1週 |
|
課程介紹 |
第2週 |
|
Corpus Data Processing: Introduction |
第3週 |
|
語料庫與詞彙資源介紹(CELEX, Chinese and English Wordnets, Sinica Corpus) |
第4週 |
|
語料類型與描述(1) |
第5週 |
|
語料類型與描述(2) |
第6週 |
|
語料處理之前置作業(1) |
第7週 |
|
語料處理之前置作業(2) |
第8週 |
|
語料處理之前置作業(3) |
第9週 |
|
語料統計模式(1) |
第10週 |
|
語料統計模式(2) |
第11週 |
|
語料統計模式(3): Linear Models |
第12週 |
|
語料的視覺化 |
第13週 |
|
語言學經驗研究之方法論 |
第14週 |
|
簡易語言網路資料庫設計 (1) |
第15週 |
|
簡易語言網路資料庫設計 (2) |
第16週 |
|
簡易語言網路資料庫設計 (3) |
第17週 |
|
期末綜合討論 |
第18週 |
|
期末報告 |